Minimum

对两个输入数据执行逐元素取最小值操作。对于每一对对应的输入元素,比较其大小,并将较小者存入输出地址。

\[output_i = \min(input0_i, input1_i)\]
输入:
  • input0 - 第一个输入数据地址。

  • input1 - 第二个输入数据地址。

  • length - 计算长度。

  • core_mask(int, 可选) - 核掩码(仅适用于共享存储版本)。

输出:
  • output - 计算结果地址。

支持平台:

FT78NE MT7004

备注

  • FT78NE 支持:int8 (i8), int16 (i16), int32 (i32), fp32 (fp), fp64 (dp)

  • MT7004 支持:int16 (i16), int32 (i32), fp16 (hp), fp32 (fp)

  • 两个输入数据与输出数据的数据类型必须一致。

共享存储版本:

void i8_minimum_s(int8_t *input0, int8_t *input1, int8_t *output, int length, int core_mask)
void i16_minimum_s(int16_t *input0, int16_t *input1, int16_t *output, int length, int core_mask)
void i32_minimum_s(int32_t *input0, int32_t *input1, int32_t *output, int length, int core_mask)
void hp_minimum_s(half *input0, half *input1, half *output, int length, int core_mask)
void fp_minimum_s(float *input0, float *input1, float *output, int length, int core_mask)
void dp_minimum_s(double *input0, double *input1, double *output, int length, int core_mask)

C调用示例:

 1// FT78NE 示例(共享存储多核并行)
 2#include <stdio.h>
 3#include "78NE/utils.h"
 4
 5int main(int argc, char* argv[]) {
 6    double *in0 = (double *)0xA0000000;   // 输入0在共享存储空间
 7    double *in1 = (double *)0xA1000000;   // 输入1在共享存储空间
 8    double *out = (double *)0xB0000000;   // 输出在共享存储空间
 9    int length = 960001;
10    int core_mask = 0xFF;                 // 使用所有核心并行计算
11    dp_minimum_s(in0, in1, out, length, core_mask);
12    return 0;
13}

私有存储版本:

void i8_minimum_p(int8_t *input0, int8_t *input1, int8_t *output, int length)
void i16_minimum_p(int16_t *input0, int16_t *input1, int16_t *output, int length)
void i32_minimum_p(int32_t *input0, int32_t *input1, int32_t *output, int length)
void hp_minimum_p(half *input0, half *input1, half *output, int length)
void fp_minimum_p(float *input0, float *input1, float *output, int length)
void dp_minimum_p(double *input0, double *input1, double *output, int length)

C调用示例:

 1// MT7004 示例(私有存储单核)
 2#include <stdio.h>
 3
 4int main(int argc, char* argv[]) {
 5    // 输入与输出均位于芯片私有存储空间
 6    half *in0 = (half *)0x10000000;
 7    half *in1 = (half *)0x10001000;
 8    half *out = (half *)0x10002000;
 9    int length = 1024;
10    hp_minimum_p(in0, in1, out, length);
11    return 0;
12}